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Застосування генетичного алгоритму 
у задачах адаптаци структур даних 


Представлена разработанная схема адаптации структур данных в оперативной памяти. Для поиска 
адаптированной структуры данных предложено применение генетического алгоритма. Определены его 
особенности. Для растровых изображений с соответствующими заголовками выполнены эксперимен- 
тальные исследования временной эффективности адаптированных структур данных, времени сходимости 
генетического алгоритма и условия целесообразности применения адаптации. 
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Представлена розроблена схема адаптаций структур даних в оперативний пам’ят!. Для пошуку адаптовано1 
структури даних запропоновано застосування генетичного алгоритму. Визначен! його особливост1. 
Для растрових зображень з вдповдними заголовками виконан! експериментальн! досллдження часовот 
ефективност! адаптованих структур даних, часу зо жност! генетичного алгоритму та умови дощльности 
застосування адаптаци. 
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Введение 


Адаптация растений И ЖИВОТНЫХ К окружающей среде, человека к природным 
УСЛОВИЯМ ЖИЗНИ И социальной среде, как правило, основана на неинтеллектуальных 
механизмах. В искусственных программных средах адаптация невозможна без приня- 
тия соответствующих решений, т.е. без элементов искусственного интеллекта. 
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Современные программные, информационные системы все более интеллектуа- 
лизируются, приобретая адаптивные способности. Адаптация широко применяется 
в интерфейсах пользователя, значительно реже в части обработки и преобразования 
данных, но практически не применяется при хранении данных на различных носителях. 
В данной работе, восполняя этот пробел, в развитие предложенного ранее подхода [1], ре- 
шается задача структурной адаптации структур данных (СД) в оперативной памяти (ОП). 

Временная эффективность обработки СД существенно зависит от способа пред- 
ставления данных в ОП, значения этих данных, порядка их обработки и программно- 
аппаратной среды эксплуатации. Это подтверждается особенностями обработки СД 
в оперативной памяти [2] и выполненными ранее компьютерными экспериментами [3]. 

Применение генетического алгоритма (ГА) для поиска наиболее подходящих 
СД обусловлено сложной зависимостью их временной эффективности от программно- 
аппаратной среды эксплуатации и порядка использования СД. Свойства этой зависи- 
мости неизвестны и сложно формализуемы. Как известно, ГА в таких случаях является 
наиболее подходящим инструментом [4|, [5]. 

Цель данной работы — исследование эффективности применения предложен- 
ного ранее метода адаптации структур данных [1] и генетического алгоритма как его 
составной части. 


Постановка задачи 


Экспериментальными методами необходимо установить: 

— насколько большим может быть преимущество адаптированной СД по отно- 
шению к традиционным и единообразным способам их представления; 

— время сходимости ГА; 

— условия, при которых адаптация будет в принципе полезной. 

Преимущества адаптированной СД можно оценить с помощью показателей сте- 
пени и области превосходства [1]. 


Схема адаптации 


Порядок и составляющие процесса адаптации на основе ПРО диаграмм [6] пред- 
ставлены в табл. | с пояснениями, приведенными ниже. 


Таблица 1 — Процессы адаптации структур данных 


Вход Процесс Выход 
Диаграмма логической СД, Разработки МЕКА- Файл формата *.а, 
формируемая диаграммы [1] средствами содержащий логическую СД 
в интерактивном режиме редактора диаграмм Па [7] 


Конкретный экземпляр дан- |Формирование ХМГ. файлов |*.хи файл 
ных, на которых выполняется 
адаптация; *.Фа файл 

В составе генетического алгоритма 


„Ча файл; шаблоны Формирование хромосомы __| Хромосома 

Хромосома; поколение Формирование поколений Поколение хромосом; лучшая 
хромосом хромосом, отсеивание и отбор | хромосома 

*.Ча файл; хромосома; набор |Генерация физических Конкретная физическая СД, 
шаблонов реализаций соответствующая хромосоме 
*.хт| файлы; сценарий Регистрация времени Время выполнения 

работы с данными; физической реализации 


физическая реализация СД 
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Концептуальная модель логической структуры данных должна отображать состав- 
ляющие, их свойства и связи между составляющими. 

На рис. 1 показан пример такой модели. Данное представление основано на из- 
вестных средствах ЕК-диаграмм [8] и представляют собой модифицированные ЕК-диа- 
граммы, нагруженные атрибутами, — МЕКА-диаграммы. Особенности формирования 
логической структуры данных приведены в [1]. 


Индексированные данные 


Разнотипные 
Изображения Палитра 


Однотипные Однотипные 


Тип: индекс палитры(Байт) Тип: пиксель (КОВОПАО) 


Количество= 
ширина изображения * высота Количество=256 


изображения 


Рисунок 1 — Фрагмент логической структуры данных *.6тр файла 


Структура данных на физическом носителе информации (в данном случае в опе- 
ративной памяти), т.е. порядок расположения элементов и методы доступа к ним, в 
соответствии с выбранным порядком определяют физическую структуру данных. 

Для формирования конкретной физической СД применяем программные шаб- 
лоны [1]. Программный шаблон — полный набор методов доступа к элементам СД, 
которые определяют порядок размещения данных, обеспечивают формирование СД, 
добавление/удаление элементов, поиск и т.п. В данной работе реализованы такие шаб- 
лоны: динамический массив, связный список, связный список массивов, хэш-таблица. 

Реализация конкретных физических СД выполняется на основе логической СД 
и шаблонов. Для каждой связи в логической СД выбирается один из шаблонов. В соот- 
ветствии с выбранными шаблонами, средствами рефлексии [9] формируется программа 
обработки данных. 

Порядок обработки данных, т.е. последовательность операций добавления, уда- 
ления, поиска и др., назван сценарием. 

Сценарий может быть определен средствами стохастических грамматик [10], 
отслеживанием порядка обработки данных в эксплуатируемой системе, предельными 
количествами каждой операции обработки данных (с возможностью задания прио- 
ритетов операций и ограничений на их последовательность). В данной работе применен 
последний способ. 
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Особенности генетического алгоритма 


Для адаптации структур данных применялись известные подходы [11] на основе 
генетического алгоритма [4] с особенностями, обусловленными спецификой решаемой 
задачи. 

Представим детализацию обобщенной схемы работы ГА [5]. 

Оптимизируемыми параметрами являются физические реализации СД каждого 
отношения логической СД. 

Кодирование хромосом выполнено в виде вектора чисел. Каждое число (аллель) 
представляет собой порядковый номер в списке шаблонов. Позиция числа (локус) в 
хромосоме обозначает индекс отношения, к которому применяется шаблон. Гены в 
хромосоме не являются зависимыми или взаимозаменяемыми. В старших битах чисел 
могут кодироваться дополнительные свойства шаблонов. Так, для связных массивов 
указывается количество элементов в каждом массиве. 

Имея в логической структуре пять отношений и четыре шаблона, общее коли- 
чество возможных физических реализаций — 1024 4) 

Целевой функцией является время выполнения набора сценариев на совокуп- 
ности файлов, к которым выполняется адаптация. 

Инициализация начальной популяции выполняется следующим образом. Каж- 
дая хромосома заполняется одинаковыми аллелями. Количество хромосом в первом 
поколении соответствует количеству различных шаблонов. Например, для пяти отно- 
шений и четырех шаблонов в первом поколении будет присутствовать четыре особи: 
[0, 0, 0, 0, 0], [1, 1, 1, 1, 1], [2, 2, 2, 2, 2], [3(25), 3(25), 3(25), 3(25), 3(25)]. Здесь 0 — дина- 
мический массив; 1 — связный список; 2 — хэш-таблица; 3 — связный список массивов, 
25 — количество элементов в связных массивах. Для повышения разнообразия хромосом 
в первое поколение также добавляются несколько потомков существующих хромосом. 

Оператор отбора выбирает хромосомы для следующего поколения и скрещива- 
ния со значением целевой функции выше среднего для хромосом текущего поколения. 

Оператор скрещивания выполняется на основе нескольких родительских хромо- 
сом, количество которых задается параметром ГА. 

Скрещивание генов хромосомы производится следующим образом: для каждого 
локуса генерируется случайное число, значение которого определяет номер родителя 
в наборе родительских хромосом: 


АЕ 


где Х, =[х, 1, А | — родительские хромосомы, У = [У11е асе У — До- 


черняя хромосома; & — вектор случайных чисел; п — кол-во отношений. 

Пример скрещивания приведен на рис. 2. 

Оператор мутации изменяет выборочные гены сложением по модулю т (кол-во 
шаблонов) текущего значения с единицей. 

Критерий остановки — отсутствие изменений лучшей хромосомы в течение 
заданного количества поколений. 

Параметры ГА алгоритма: вероятность участия хромосом в скрещивании, пре- 
дельное количество поколений, минимальное количество хромосом в популяции, веро- 
ятность мутации, количество родительских хромосом для скрещивания, количество 
уникальных хромосом для скрещивания. 
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х 1=[0,1 ‚2,3,0,1 ] 


1=1 


= [3,2,0,1 ‚2,3] 


Х2= [0,3,2,1 ‚2,1] 


> У.=[0,2,0,3,2,3] 


Рисунок 2 — Скрещивание хромосом Х,,Х,,Х, 


Экспериментальные исследования адаптации 


Для определения возможностей и оценки эффективности адаптации выполнен 
компьютерный эксперимент. 
Цель эксперимента — оценка эффективности ГА и адаптации для растровых 
изображений, считанных из ВМР файлов, в оперативной памяти. 
Экспериментальная база состояла из пяти компьютеров, характеристики которых 


приведены в табл. 2, и исследуемой выборки из 33 файлов формата *.Бтр размером 
2...3 Мб. Объем данных подобран таким образом, чтобы он значительно превышал 
размер кэша данных. В противном случае любая физическая реализация будет обес- 


печивать максимальную временную эффективность структур данных. 


Таблица 2 — Технические характеристики компьютеров 


Кэш [.1 | Тактовая частота / Время 
ПЭВМ Процессор кода / [,1 |частота системной | доступа к ОП: | Операционная 
данных / шины / частота чтение / система 
Г2, Кб памяти, МГц запись, Мб/с 
С Ш Соге 2 Оио 32132 2400 (12 х 200) / 5350 / 1962 |\УМшдо\з 7 
ь Е4600 2048 800 / 400 Оатае РгоЁ 
С ша С@егоп ©0530 |2х32/2х32/ |2 400 (24 х 100) / 7470 / 3590 |\Ушдо%\з 7 
? |РиаЁСоте 2х256 100 / 532 Оатае РгоЁ 
С ша С@егоп ЕЗ400 |2х32/2х32/ |2 600 (13 х 200) / 4250 / 1680 |\Ушдо\з 7 
3 [3800 ча! Соге 1024 200/400 Оатае РгоЁ 
С Ше МоШе Соге 2 |2х32/2х32/ |1 666 (10 х 166) / 5850 / 1720 |\Ушдо\з 7 
* |Поо Т5500 2048 666 / 333 Ияатае 
С Пе Соге 2 Оир 2х32/2х32/ 11 200 (6х 200) / 4370 / 1200 |\Ушао\з ХР 
> |Е6500 2048 800 / 333 РгоЁ 


Логическая структура данных ВМР файла [1] имеет шесть отношений, связыва- 


ющих основные подструктуры: заголовок ВМР файла (Р), информационный заголовок 


(Р,), палитра ( Р.), цвета палитры ( Р, ), данные изображения ( Р.) и их связующая ( Р.). 
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Формирование сценариев обработки данных выполнялось стохастическим методом 
с заданными границами для количества применяемых операций обработки данных, 
которые приведены в табл. 3. 


Таблица 3 — Ограничения методов обработки данных 


Количество включений 
Подструктура Метод метода в сценарии 
Мш Мах 
В Все 10 методов 0 0 
р Чтение ширины изображения в пикселях 0 100 
. Остальные 21 метод 0 0 
Р, Все 8 методов 0 0 
р Добавление цвета в палитру 0 256 
. Остальные 7 методов 0 0 
Добавление пикселя к изображению 10 000 20 000 
Р: Удаление пикселя из изображения 1000 2000 
Остальные 6 методов 0 0 
Р; Все 8 методов 0 0 


В эксперименте выполнены исследования с применением трех сценариев: с огра- 
ничением, как в табл. 3, (А, ) и уменьшенными ( А, ) и увеличенными ( А, ) в 10 раз. 


Всего выполнено 45 опытов (адаптаций) — на пяти компьютерах по сценариям с 
тремя наборами ограничений, повторяя каждый опыт трижды. 

Выполнена оценка качества адаптированных структур данных. Для оценки того, 
насколько найденные адаптивные СД лучше однотипных, в том числе и общепринятых, 
определены 5- и №-показатели временной эффективности [3] сценариев работы с дан- 
ными, построенных по заданным ограничениям (табл. 3): 


+27,0 +277 +29,0 +20,4 +29,3 +0 
55 =[55,0`57 ‚ 54,6571 ‚ 25,855, 69, Год, 57, Гз |, К, =100%. 
Здесь 5, — показатель степени превосходства [1] адаптированной структуры над 


контрольными, которая основана на временных значениях выполнения алгоритмов 
(сценариев) обработки структур данных; { — адаптированная структура, / = 1...4 — 
структуры, соответствующие хромосомам [0, 0, 0, 0, 0], [1, 1, 1, 1, 11, [2, 2, 2, 2, 2], 
[3(25), 3(25), 3(25), 3(25), 3(25)], ] = 5 - случайным образом сформированная струк- 
тура. Отметим, что показатель 5,, = 50% соответствует двукратному превосходству по 


времени одного сценария над другим. 

Большие доверительные интервалы отражают существенный разброс разницы по 
времени выполнения сценариев обработки адаптивной и контрольных структур данных. 

Как показал эксперимент, адаптированные структуры данных в параллельных 
опытах часто не совпадают, то есть получена достаточно низкая воспроизводимость. 
В табл. 4 показаны структуры данных (закодированные хромосомы), к которым наи- 
более часто сходился генетический алгоритм. 

Разница между средним временем выполнения сценария на адаптированной 
структуре данных (2, ) и контрольной структуре, сформированной на основе динами- 


ческих массивов - хромосома [0, 0, 0, 0, 0] (1), достаточно большая. Если в процессе 
эксплуатации предполагается, что количество подобных сценариев № =Т, /(#, -г,) будет 


больше 5...150, то время, затраченное на адаптацию, будет компенсировано экономией 
времени работы алгоритма. 
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Таблица 4 — Оценка эффективности адаптации 


Средняя 

Преобладающие Среднее экономия Количество 
адаптированные время времени о 
ее Сценарий | адаптации на одном при котором 

(х а Т ‚ мин сценарии ее 
р и | и оправдана, № 

0 а? 
[2,3(50),2,2,2,2] Ао 17,6 20,7 З 
о А, 80,2 285,6 ТУ 
Ре А, 556,6 5020 г 
[2.0,2,2.2,2] т 14.2 5.8 148 
[1,0,1,1,1,1] А. 46,9 54,0 53 
[0,3(100),0,0,0] а 

Р222 А, 21,5 49 
РИ 2] - —_ - 
2 А) 5088 7 
[2,0,2,2,2] Ау 29,3 47 
[2,3(50),2,2,2,2] А. 291,4 12 
А, 6340 9 
[2,2,2,2,2] А Е 65 
А 228,2 20 
А 6163 5 


Приведенные ранее результаты говорят о достаточно хорошей скорости сходи- 
мости ГА и качестве найденных структур данных. Лучшая хромосома появлялась в 3...5 
поколении и ГА сходился за 7...25 поколений. Однако подобранные параметры ГА не 
являются оптимальными. Было бы целесообразным решение задачи нахождения опти- 
мальных параметров ГА средствами другого ГА и на более представительной выборке. 


Характеристика представленного метода адаптации 


Рассмотрим характеристики адаптации структур данных по схеме, предложен- 
нойв [12]. 

Требования к качеству. Применяется для адаптации программ с преобладающей 
обработкой структур данных с повышенными требованиями к временным характе- 
ристикам. 

Элементы внешней среды, к которым выполняется адаптация: потоки входных 
данных (наборы входных данных при многократном выполнении программ) и прог- 
раммно-аппаратная среда эксплуатации. 

Адаптирующий алгоритм представлен в виде отдельного алгоритма на основе 
генетического. 

Адаптация структур данных выполняется в процессе эксплуатации в автоматиче- 
ском режиме. 

Для оценки качества применен измерительный алгоритм, который является 
частью адаптирующего и измеряет время обработки данных в определенном порядке 
размещенных в оперативной памяти согласно сгенерированной структуре данных. 
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Метод адаптации можно квалифицировать как метод структурной адаптации 
одновременно алгоритма и структуры данных. 

Приведенные эксперименты показали, что в разных средах эксплуатации повыша- 
ется или, по крайней мере, не ухудшается временная эффективность структур данных. 

Таким образом, представленный метод адаптации имеет все признаки полноцен- 
ного адаптивного алгоритма. 


Выводы 


Разработанная методика адаптации структур данных [1] апробирована экспери- 
ментальными исследованиями адаптации СД для растровых изображений, считанных 
из ВМР файлов, в оперативной памяти. 

Установлено, что время выполнения стохастических сценариев обработки дан- 
ных, адаптированных СД, в 1,5...3 раза меньше времени выполнения соответствующих 
сценариев на контрольных, в том числе общепринятых, СД. 

В работе определено одно из ключевых условий, при которых адаптация является 
целесообразной. В зависимости от количества методов обработки данных в сценарии 
и конкретных программно-аппаратных сред эксплуатации СД адаптация оправдана, 
если количество подобных сценариев при эксплуатации превышает 5...150. Таким обра- 
зом, предполагается достаточно быстрая окупаемость адаптации по временным затратам. 

Для повышения эффективности ГА предполагается автоматизация подбора его 
параметров. 
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